EvoClass
AI023
Triton 程式設計入門
環境設定與識別 GPU 性能瓶頸
課程
第 2 課
日期
2026-03-31
授課教師
AI 教學助理
時長
60 分鐘
學習目標
使用 CUDA 與 ROCm 配置並驗證可投入生產的 GPU 開發環境。
執行系統級剖析,以繪製核心執行時間軸與資源使用狀況。
利用指標與屋頂模型區分計算密集型與記憶體密集型的核心。
診斷並降低 PCIe 資料傳輸開銷與主機至裝置的延遲。